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© precede at Installation de sequencage de I'ADN. 

@ Le precede selon I'lnvention comporte essentiellement 
une etape (2) de fragmentation de I'ADN, une etape (4) de 
reactions chlmiques specffiques des bases constituent I'ADN 
pour former des families de chatnes de tallies differentes dont 
I'une des extremites est constituee d'une base speclfique, une 
etape (6) de marquage specffique de ces chatnes avec des 
Isotopes stables, une etape (10) de separation des chalnes par 
6lectrophorese, une etape d'atomisation et d'ionisation (12) 
des chalnes separees, une etape (14) de selection et de 
detection en temps reel des ions par spectrometrie de masse et 
une etape de traitement (16) des slgnaux d6tectes pour 
reconstltuer I'ADN de depart 
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Description 

PROCEDE ET INSTALLATION DE SEQUENCAGE DE L'ADN. 

^ in , VentiC T „ Se raPP »^ 4 Un P roc6d6 et une installation de sequencage de molecules biologiques 
complexes telles que I ADN (acide desoxyribonucieique), TARN (acide ribonucleique), les proteines Ble 
s applique dans les domaines du genie genetique, de la biologie. de la pharmacologic tant au stade de 
I experimentation, de la recherche fondamentale qu'industrieMe 

o^! S ^ Uen<? 1? e ? U * en feit 6St ridentfficati on des sequences ou de I'ordre des nucleotides ou des acides 
amines des molecules complexes a pris une reelle importance dans le domaine de la biologie molecuiaire et de 
in ooni°l e ° hno og,e - En P^culier, le sequencage d'un acide nucleique (ADN ou ARN) permet ['analyse des 

t£^*£^ ? T™ 6t ^ danS d6S 96neS P*que la fonctfon d'unT^eouE 

b^logique est determinee par sa structure, la definition de la structure d'un gene est cruciale pour la 
manipulation eventuelle de cette unite de base d'information 

nucfa^,^ de faQ ° n 96n6ra,e * toutes mo,6ciJ ^s constitutes d'une succession de 

»* h" ^ acides amines et plus specialement a I'ADN. On rappelle qu'un nucleotide est forme par une 

15 base, un sucre et un phosphate. 

tvD?nun e a l^^ e l ^™.H• lqUaS • T baS69 SOnt des bases azot6es P°**dant une structure heterocyclique du 
Xm"adn Pynmid,que ; el,es ■ ont au nombre de 4 - ^ sucre est le ribose pour I'ARN et le desoxyribose 

m^^I^? em ?? , le t ™ cle °t |a ' es des acldes "ucleiques utilises sont triphosphates car c'est ce type de 
molecules qui fournlt I'energie necessalre au fonctlonnement des enzymes dans de nombreuserreacflons 
b.ochi miques, en particulier celles intervenant dans la polymerisation des ADN n0nr,Dreuses r6ac «ons 
L ARN et I ADN presentent trois bases communes : I'adenine (A) et la guanine (G) qui sont des Durlnes et la 
cytosme (C) qui est une pyridine. L'autre base pyrimldique est la thymine (T) ^J^DH^vZ^)^ 

deso™ o^nf S t2nhl re £T de " u ^i otides concemes sont le desoxy adenosine triphosphate ou dATP, le 
MnZZJT S >S J? hatC ° U dGTP ' le d6sox y c y tosine triphosphate ou dCTP et le desoxy thymine 
triphosphate ou dTTP. On les note ci-apres dxTP avec X - A. G C ou T mymrne 

^L.^TTV™ 0 ™*' 0 " 9 6n6ti ^ ue complete necessaire a la fabrication des proteines elements 
fSZ^^SF™ ^ En P** 1 ^- <**que succession de trois bases esHe code S 
£n^t A . RN messa 9 ers - d un acide amine qui entre dans la composition d'une proteine u[ 

?«t£!£ a T T d 0Wenlr rordrB des bases c°r*tituant un brin d'ADN ou d'ARN 
d„ n*™™^!f s l t ' ue . n 9 a 9 e de |,ADN component essentiellement 5 stapes qui sont (a) la fragmentation 
J ( rta 5 t,ons chimiques de sequencage pour former des chaTnes * VwottSKTfcJto 
marquage des chaines de nucleotides, (d) la separation des chaTnes marquees et (e) te dSon. 

Etape a 

iu pour la levure et 3 x 10* pour I homme . Le genome, du fait de sa longueur ne r>eut fitre dlreetenu»nt 
S,e *-'ADN est scinde en fragments ^bJ^oS^S^JS^S 

7?n™? « P J£, .- ° IOna9e - Par """P*. cette fragmentation peut etre effectuee par I'utJIIsatton 
ZZZEZ restrict| on ' *H coupent I'ADN au niveau de certaines sequences ou par nStaScSTS 

ezzxs rs^r ,,art,cle ' Current Appre * ches to dna sequencing * de j c - 

45 Etape b 

auS ta^^'SfflS!' 8 f !l! aTneS obtenues en ^ series de reactions chimiques specifiques des 

Ses^xtSet l^^^t^ ™" d t I 8 "?' al ' obtentton de qu»tre families de chaTnes d'ADN dont I'une 
slries deTeSion. C ° mmUnement ^ et 1 autre 631 constituee d'une base specifique de I'une des quatre 

H6™.^n 6th<X l? 8001 com . munement "tHisees pour obtenlr les 4 families de chaTnes d'ADN ci-dessus L'une 

detchflTn! « f^' ^ f^° d f ° r se< l uenclna DNA") appel a une procedure de degradation chimique 
DeL^hl ^'J ntr0dU,,e SanflSr (San 9 er R et "L. Proc - Na «- Acad. Sci. USA 74. pp. 5453^467 de 
«mntl ^-ii NA se " uencin 9 chain-terminating inhibitors') est une methode e^nzyr^tfaue et 
emploie un precede de terminaison de chaTnes didesoxy enzymanque et 

d exTmoti^t^nM 8 8m 0^ e '»««» q"atre reactions de sequenqage met en jeu un grand nombre 
Qui esTun oL^i^ n H° Cat6nai ,T * s6 " uenoer = un ««««r (ou en terminologle anglo-saxonne prime™ 
n,^i!^ J/ °!« o - nu c'80tide complementaire de I'une des extremites de I'ADN a sequencer • les auatre 
nucleotides dXTF • ; une enzyme qui permet la fabrication du brin complementaire ^de l ? ^ seauencef 4 
eo^ ^u C S 0t 't deS , 6t f" oon l mencar '< Par Tamorceur et enfin un seul des quatre i£S£Z£SS& 
ca^ne n ^d°u a desox^os e e " 0t6 ^ °* nUCle ° t,d0 ^ » ^ ue ,e 9-Kf£ 

L'amorceur se Pe a I'ADN a sequencer par complementary puis I'enzyme synthetise le brin 
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complementaire jusqu'a ce qu'elle incorpore le ddXTP arr§tant ('elongation de la chatne. ^incorporation du 
nucleotide terminal peut se produire n'importe quand au cours de ta synthese ce qui se tradult, a la fin de 
('operation de sequencage specifique d'une base X donnee, par la presence d'une famille d'ADN representant 
toutes les longueurs possibles depuis I'amorceur jusqu'a environ 400 nucleotides. 

Appliquee en parallels pour les quatre ddXTP, la serie de quatre reactions conduit a un nsemble de quatre 
families de chaTnes d'ADN ; les chaTnes de chaque famille etant representatives d'une base X donn6e sont 
ensuite deposees sur un gel d'electrophorese. 

Dans la methode de Maxam et Gilbert, des chaTnes d'ADN de dimensions adaptees et analogues a celles 
issues du precede de Sanger sont produites par un traitement chimique d'ADN purifie. Cette operation permet 
de sequencer un ADN mono- ou bicatenalre marque avec un phosphate radioactlf a I'une de ses extremites. 

Pour chacune des quatre series de reaction de sequencage, I'ADN est sournis a un jeu de deux reactions 
chimlques. la premiere reaction chimique modifie et retire la base de son sucre, la seconde coupe I'ADN en 
retirant le sucre ainsl expose. On obtient ainsi des chaTnes commencant a un endrolt fixe et se terminant par 
une base connue. Les conditions de reaction sont ajustees de facon a produire des chaTnes de toutes les 
longueurs possibles comportant typlquement de 1 a 400 nucleotides. 

Etape c 

Les chaTnes obtenues en (b) sont marquees prealablement, ou au cours des reactions, avec des marqueurs 
radioactifs. Les marqueurs radioactifs utilises sont le 32 P ou le 36 S, le tritium, le 14 C qui sont des emetteurs de 
rayonnementsp-. 

Dans le cadre de la methode de Sanger, il est possible de marquer I'amorceur, les dXTP ou les ddXTP. 
Etape d 

Les chaTnes d'ADN marquees sont alors separees sulvant leur longueur, les plus petites migrant le plus vite 
et les plus grandes le plus lentement. Ce gel d'electrophorese qui est en general un gel de polyacryfamide 
permet de differencier les mol6cules de longueur N et N+1 avec N variant de 1 a 400 environ. 

L'electrophorese dure de 4 a 12 heures suivant ta longueur du gel qui est ensuite seche. 

Etape e 

Le gel est ensuite place contre un film sensible au rayonnement beta. Les marqueurs radioactifs Incorpores 
dans les chaTnes d'ADN sont utilises pour developper une image auto-radiographique de chaque trace 
electrophoretique. L'auto-radiographie est developpee apres 12 heures ou plus d'exposition au rayonnement. 

La position relative des bandes qui apparaissent sur I'image auto-radiographfque, au seln des quatre 
colonnes correspondant aux quatre families de reactions, permet la determination de la sequence des bases 
de I'ADN de depart. 

Apres (a lecture, Texamen et Interpretation de I'auto-radiographie, la sequence est entree dans la memoire 
d'un ordinateur pour une analyse et un assemblage ufterieurs. 

Ces deux methodes de sequencage d'ADN precedemment decrites sont largement utilisees et component 
chacune plusieurs variantes. Bien que tres performantes et efficaces, ces methodes demandent une mise en 
oeuvre tres complexe qui comporte de serieux inconvenients. C'est en realite un tres gros travail delicat, qui 
doit Stre extremement bien standardise pour que la source de connaissances et la comparaison des 
migrations electrophoretiques soient fiables. 

Par ailleurs, la lecture des electrophoreses des chaTnes radioactives se fait apres autc-radiographie. La 
aussi, une parfaite reproductibilite est de rigueur tant dans le developpement de ces auto-radiogrammes que 
dans leur lecture. 

En effet, I'lmage sur film d'une bande de gel radioactif est plus large que la bande elle-meme et la 
comparaison des positions des bandes entre les quatre pistes differentes de l'electrophorese (qui peuvent 
induire un comportement non untforme quant aux mobilites des chaTnes) peut limtter la resolution 
effecth/ement observes sur t'auto-radiogramme et done reduire la longueur de la sequence qui peut etre lue a 
partir des gels. Typlquement, de 200 a 400 bases peuvent §tre lues a partir d'un simple Jeu de traces. 

De plus, les irregularftes survenant d'un trace a un autre peuvent rendre difficile la lecture automatique des 
auto-radiogrammes par des techniques d'imagerie existantes (par exemple densftometres a balayages) car 
Toeil humain peut actuellement mieux discriminer ces irregularftes que ne le font les ordinateurs. 

La necessfte d*un soin intensif quant a Tanaiyse ■manuelle" des auto-radiogrammes demande done du 
temps et est sujette a des erreurs. 

Par ailleurs, I'utilisation de marqueurs radioactifs presents de serieux inconvenients quant a la manipulation 
(systeme de protection complexe des operateurs et decontamination periodique des installations), au 
stockage des produits durant I'analyse et au stockage des dechets en fin d'analyse 

Enfin, i) n'est pas possible d'observer les bandes au seln du gel pendant l'electrophorese afin de contrdler 
('operation en cours, mais il faut necessairement temniner Telectrophorese a un moment dfetermine et attendre 
le developpement de rauto-radiogramme avant de pouvoir lire la sequence. 

Aussi, plusieurs procedes ont deja envisage la detection en temps reel des chaTnes d'ADN pendant leur 
migration au cours de l'electrophorese. 

Les uns s'lnteressent par exemple a la detection du rayonnement p- 6mis par les chaTnes marquees au 32 P, 
les autres s'lnteressent a la detection de remission de fluorescence induite par un falsceau laser. 
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Dans le premier cas. la detection en ligne (ou temps reel) des bandes radioactives au cours de 
lelectrophorese peut permettre une certaine simplification, par une certalne reduction du nombre des 
operations a effectuer, pour 1'ensemble du precede. Cependarrt. il faut tenlr compte de la courte period© de 
demi-vle du phosphore 32 et par consequent de rinstabilite des reactifs de marquage radioactlf. En outre 
5 comma dans les methodes plus tradition nelles de Sanger ou Maxam et Gilbert. II demeure que des problemes' 
sont poses par I elimination et la manipulation des prodults radioactJfs. 

iJ^°^?:~VT PS « 6 J! 88 ^ 6 des chaInes dev an* 'e detecteur etant tres redurt. cela implique une plus 
resolution c 0 "**'™ des rayonnements. ce qui peut entralner des problemes de sensibility et de 

W DE^? 6l C r^\t^H- f fiuo , res f c ? nce j" d " i te faisceau laser a ete proposee par Ansorge (voir 

a- 1„ * ' 8,1,016 Joumal of Biochemical and Biophysical Methods. 13(1986), pp 315-323 "A 

fl^h autornat ed method for DNA sequence determination-. Cette methode utilise un seul 

fluorophore pour marquer I'amorceur (ou primer) dans le cadre de la methode de Sanger 
a o,,^ 8 ^, 038 '^ 8 2 U - atre S6ries de r6actions de sequencage conduisent. comme decrit precedemment a 

^ZX^T^^ d6P ° S6eS 8U L qUatre piSteS para " 6,9S d ' un & d'^ctrophorese qui es? 

lont ovt»rI c i ' ™* , Sa lar9eUr - un falsceau ,aser Au sein du 0* les cnaTnw d'ADN marquees 

STttZESSSS* dans ,,ordre de 13 s6quence - ,orsqu ' e,les pa88ent dans ,e fa ^» u 

«, ocf^L 0 ^" 6 P ' Ste d * 6l ? ctr °P nor ^e associee a une famille de reactions donnee. la lumiere de fluorescence 
SO es collect^ par une optique adaptee et conduite. apres filtrage, a un detecteur de type photomuZ^eu? 

detectforarlL^ teC « hn ' qUe eSt rabSenoe de toute ^ mobite ™ •* deTaJgS de' 

dS°o P hoS. detecteure fixes ^ Permettent une detection continue sur les quaTre pistes 

« n^nftf 018 ' l ' utilisati ° r l d,,Jn seul flu «>rophore conduit inevttablement a ('utilisation de quatre pistes en 
5SSSLT; r e ,K 3 , el d « ec r°P horSse - P° ur ''etude d'une seule sequence, ce qui llmtte "eTposSbUftfe 

■^^sssisr " en est de m6me ,ore de ,a ^ en -SSK 

m o^f.fT^ n l!L de K d6 ^ Cti0n en temps r6el "6oessitent aussl une grande fiabilite quant a la comparalson des 

de ces systemes ne rend ces approches que partiellement reussies spewnque ae cnacun 

r.» U " P , rern,er sysj^rne a ete propose par L.M. Smith et al. (voir FR-A-2 558 262). dans le cadre des reactions 
nlt^t e "^° d ° Sa "? er - Dans cette technique, les reactions de sequenpageTo^em s^StS^s 
diction d6cm r^ S m. C ^t U ? T ^ fluoreSCerrt ^nti au ^r vZ^l 

ce^^l^J^Z^^^ te ^ de "V**™ results comporte au demeurant 

= c 1 n ^ Jy IST Smes 8004 en9endrts par ™ lisation de mol6cu,es 

d^nhnftlf f f". 36 t ? C "£ Par |,existence de Perturbations au cours de felectrophorese dues aux differences 
r-H-S ^ °ette technique requiert obDgatolrement ('utilisation de quatre -primers" SDecfflaues maraufe 
■ZTS I, SSI. ,T 0 " d """"a"- & P«rtoulsr. >« qu.tr, rations de ^JUwiwuC 

TO^^lSSh^ "! r deS d6ca,a 9 es ^visible* dans les mobilrtes de certain^ c^aTnes au 

Se lapoS reStreindre f ° rtement 16 Ch0ix d ' enz V mes de complementamT; ced 

p Xe utilisation des enzymes courantes, comme par exemple le fragment de Klenow d'ADN 
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L'invention a done pour objet un procede d'identffication des sequences d'un ADN permettant de remedier 
a la plupart des inconvenients donnes precedemment. Des problemes sirnilaires apparaissant dans le 
sequencage de tout autre acide nucleique et, en partlculler, dans les ARN, invention s'applique a tout type 
d'acide nucleique. 

Aussl, l'invention a pour objet un proced6 d'identffication de la sequence des bases d'un acide nucleique 5 
comportant essentieltement : 

a) une etape de production de fragments a sequencer, 

b) une etape de reactions chimiques spectfiques desdites bases pour former des families de chatnes 
de tailles differentes dont Tune des extremites est constituee d'une base specifique, 

c) une etape de marquage specifique desdites chatnes avec des isotopes ou petites molecules stables, 10 

d) une etape de separation des chatnes marquees, 

e) une etape d'atomisation et d'ionisation de chaque chatne marquee puis, 

f) une etape de detection en temps reel des ions formes par spectrometrie de masse. 

Le fonctionnement en temps reel est lie au fait que, dans l'invention, les ions sont detected au fur et a 
mesure de leur formation. 15 

Le precede selon invention, grace a ('utilisation de trois, quatre ou plusieurs isotopes ou petites molecules 
stables, e'est-a-dire non radioactives, done non dangereuses pour les operateurs, facilite considerablement 
les interventions humaines dans le procede de sequencage. En outre, Pionisation des chatnes marquees puis 
la detection de ces chatnes par un spectrometre ou analyseur de masse facilite considerablement la detection 
des chatnes marquees et done le sequencage des acides nucleiques. 20 

Le procede de l'invention fonctionne en contlnu et ne comporte pas d'etape de radiographie seion Part 
anterieur, longue et delicate. 

En outre, Pionisation et la spectrometrie de masse permettent ('utilisation de marqueurs lies de maniere 
intrinseque ou extrinseque aux differents nucleotides, ce qui autorise Papplication de ce procede aux diverses 
methodes chimiques de sequencage les plus repandues, et en particulier, celfes de Sanger ou de 25 
Maxam-Gilbert relatives au sequencage de I'ADN. 

Par petites molecules, il faut comprendre des composes chimiques pouvant etre lies aux nucleotides et qui 
component au moins un element marqueur identifiable par spectrometrie de masse, tel que CFa, Si(CH3)3, en 
utilisant par exemple une technique decrite dans Particle Tetrahedron Letters, vol. 26, N° 40, pp. 4915-4918 
(1985) CD. Pein, D. Cech. 30 

L'invention a aussi pour objet une installation d'identffication de la sequence des bases d'un acide nucleique 
comprenant : 

- une source de chatnes de nucleotides de tailles differentes, marquees par des isotopes ou petites molecules 
stables, 

- des moyens de separation de ces chatnes marquees, 35 

- des moyens d'atomisation et d'tonisation des chatnes sortant des moyens de separation, 

- un spectrometre de masse pour selectionner et detector les ions et 

- des moyens de traitement des signaux fournls par le spectrometre. 

De facon avantageuse, on utilise comme moyen de separation des chatnes marquees, un dispositif de 
chromatographic monopiste afin d'eliminer les erreurs de comparaison entre plusieurs pistes comme dans 40 
Tart anterieur. 

Des problemes sirnilaires a ceux decrits precedemment pour le sequencage de I'ADN pouvant intervenir 
lors de ('identification de la sequence des acides amines d'une proteine et de la determination d'une protane 
particullere dans un melange de proteines, ('invention a encore pour objet un procede d'identification d'une 
proteine dans un melange de proteines ou de ses acides amines, comportant essentiellement : 45 

- une etape de marquage specifique desdits acides amines avec des isotopes ou de petites molecules 
stables, 

- une etape de separation des proteines marquees, 

- une etape d'atomisation et d'ionisation de chaque proteine marquee puis, 

- une etape de detection en temps reel des ions formes par spectrometrie de masse. 50 
L'invention a encore pour objet un procede d'identification de la taflle des fragments de molecules 

biologiques complexes, comprenant essentieltement : 

- une etape de marquage des fragments, 

- une etape de separation selon leur taille, des fragments marques specifiquement et m£les a des standards 

de tailie, 55 

- une etape d'atomisation et d'ionisation des fragments puis une detection en temps reel des ions par 
spectrometrie de masse. 

D'autres caract6ristiques et avantages de l'invention ressortiront de la description qui suit, donnee a titre 
iliustratif et non timftatff aux dessins annexes, dans lesquels : 

- la figure 1 represente un schema d 'ensemble des etapes de sequencage automatise d'ADN selon 60 
l'invention, 

- la figure 2 represente un schema d'ensemble d'une installation automatisee pour le sequencage 
d'ADN conforme a l'invention, 

- la figure 3 represente le type de donnees produites par un sequencage d'ADN selon l'invention. 

La description qui va suivre se refere au sequencage de I'ADN, bien que, comme on I'a dit precedemment, 65 
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I'invention s'applique a tout acide nucleique (ARN par example) ou toute proteine complexe. 

La premiere etape du procede, en reference a la figure 1 , consiste afragmenter un genome d'ADN (etape a), 
conformement a Tart anterieur cit6. Cette etape de fragmentation porte la reference 2 sur la figure 1. 

Les chaTnes obtenues sont alors soumises aux reactions de sequencage (6tape b) selon les methodes 
5 usueltes si ce n'est que Pechelle peut etre augmentee, en cas de besoin pour foumlr une intensite de signal 
adequate pour la detection de chaque famille de chaTnes. Aucun nucleotide radio marque n'a besoin d'etre 
inciu dans les reactions de sequencage. Les reactions de sequencage sont symbolisees par le bloc 4 sur la 
figure 1. 

Le marquage des chalnes obtenues, symbolise par le bloc 6, peut 6tre realist en utilisant un isotope ou une 
10 combinaison d'isotopes stables; constituents eventuels de petites molecules stables, afin de marquer 
specifiquement les chaTnes issues de chacune des quatre series de reactions chimiques. 

Le marquage isotopique selon I'invention des chaTnes d'ADN peut dtre realise au niveau de fun des trois 
composes chimiques constftuant les nucleotides, c'est-a-dire la base, le sucre ou le groupement triphosphate 
ou eventuellement sur un groupement alpha-thiophosphate dans lequel I'atome d'oxygene lie au premier 
15 phosphore est remplace par un atome de soufre. 

Le marquage des chaTnes peut §tre realise de fapon intrinseque sur le carbone, I'hydrogene, I'azote, 
I'oxygene ou meme le soufre entrant dans la constitution des trois composes chimiques d'un nucleotide. 
L'utilisation d'isotopes naturels stables, selon I'invention, offre un choix plus important que les Isotopes 
radioacttfs generalement utilises (3*P, 35 S , 114 C , 3 H ) pouvant entrer dans la constitution des differents 
20 composes nucleotidiques. 

Une liste de ces isotopes stables, incluant leur abondance naturelle relative, est donnee dans le tableau 1. 

Tableau 1 



Isotopes naturels stables pour marquage 
intrinseque des composes nucleotiques 



Isotopes 


Abondance relative (o/o) 


D 


0,015 


13 C 


1.10 


15 N 


0,37 


17 0 


0,038 


18o 


0,20 


32s 


95,02 


33s 


0,75 


34s 


4.21 


36s. 


0,02 



40 Du point de vue chimique, les reactions pour incorporer un isotope stable ou un isotope radioactif sont les 
mimes. 

Les divers precedes de marquage de molecules biologiques par des isotopes stables existent et sont 
largement repandus (voir a cet effet I'article 'The preparation of purines, pyrimidines, nucleotides and related 
compounds labelled with 17 0. 18 0, and other stable isotopes" E. Petreanu, J.S. Cohen and D. Samuel. 
45 Proceedings of the 2nd international Conference on methods of preparing and storing labelled compounds, 
pp. 489-497). Differentes molecules marquees, en partlculier les nucleotides peuvent 6tre produttes par voie 
de synthese ou par voie enzymatique. En particulier, de nombreux composes nucleotidiques marques avec 
des isotopes stables sont disponibles sur le marche pour des applications en biologie et en pharmacologic 
differentes de celles de I'invention (voir par exemple Particle "Dehalogenation Reactions in Fast Atom 
50 Bombardment Mass Spectrometry", Anal. Chem. 1984.56. 1975.77) 

Des exemples de nucleotides marques a I'aide d'isotopes naturels sont donnes dans les annexes I et II. 
Ces exemples ont uniquement pour but d'illustrer des moyens de marquage possibles utiiisables dans 
I'invention. 

Comme donnees dans ces annexes I et II. le marquage peut s'etendre a toutes les formes de nucleotides et 
55 en particulier aux formes desoxytriphosphate et didesoxytriphosphate (annexe I) ainsi qu'a leurs analogues 
alpha-thiotriphosphate (annexe II). Ceci autorise le marquage des differentes sortes de chaTnes d'ADN issues 
des divers types de reaction de sequenpage telies que celles issues des methodes de Sanger ou de 
Maxam-Gilbert decrites precedemment. 
Comme autre nucleotide marqu6 intrinsequement, on peut citer le 1 ou 3- 16 NdATP, ra- 18 OdCTP le 
60 4- 1 80dTTP, le 2- 13 CdATP ou dCTP. le 8-"CdATP. le S'-^CdATP, I'a-SdATP, I'a-SdGTP, I'a-SdCTP, I'a-SdTTP 
ou S est Tisotope 32, 34, 33 ou 36, le methyl 13 CdTTP. 

II est aussi possible, seion I'invention, d'effectuer un marquage extrinseque des nucleotides. Ce type de 
marquage comporte I'avantage de pouvoir lier au nucleotide des atomes (sous forme mono ou polyatomique) 
qui ne sont pas naturellement presents dans ces molecules. Ces marqueurs sont constitues d'elements ou de 
65 petits complexes moleculaires d'elements alcalins, alcalino-terreux ou ha!og6niques. 



6 



EP 0 360 676 A1 



Dans le cadre des reactions de sequencage, le marquage extrinseque selon Pinvention presente molns de 
risque de denaturer les proprietes physiques et chimiques des nucleotides, contrairement a I'adjonction selon 
Part anterieur de grosses molecules telles que les chromophores ou fluorophores qui ne peuvent etre liees 
que par I'intermediaire de bras specrfiques retativement complexes. Alnsl, les elements-ou petits complexes 
moleculaires selon Pinvention peuvent dtre directement greffes au nucleotide en profitant des liaisons 5 
covaientes disponibles au sein de la base ou du sucre de chaque nucleotide (voir par exemple I'article d'Anal. 
Chem. cite precedemment). 

Des examples de marquage extrinseques selon Pinvention sont donnes en annexe III. Cet exemple donne 
un jeu co triplet de bases nucleotidiques de I'ARN marquees extrinsequement. En particulier, X represente un 
atome de fiuor, de chiore, de brome ou d'iode. 10 

Comme nucleotide marque par des halogenes utilisables dans Pinvention, on peut citer le 8-bromo dGTP, le 
5-bromo dCTP, le 3'-bromo, chloro ou iodo dTTP, le 5-bromo iodo ou fluoro dTTP, fe 3'-FdGTP. 

En tenant compte de I'existence de plusieurs isotopes stables possibles des differents marqueurs 
extrinseques (elements halogenes par exemple), les possibHltes de marquage isotopiques des nucleotides 
sont fortement accrues. 75 

Une liste des differents isotopes stables d'elements halogenes est presentee dans le tableau 2, 
accompagnes de leur abondance naturelle relative. 



Tableau 2 

Isotopes naturels stables des elements halogenes 
pour le marquage extrinseque 



Isotopes Abondance relative (%) 

19f 100 25 
35a 75,77 
37a 24,23 
79er 50.69 
81bt 49.31 

127j 100 30 



Conformement a Pinvention, n est possible d'effectuer des marquages multiples des nucleotides des 
chaTnes issues des reactions de sequencage, ces marquages 6tant des marquages intrinseques et/ou 
extrinseques* 55 

En premier lieu, on peut citer des possibility d'incorporer plusieurs isotopes marqueurs de meme type sur 
un nucleotide donn6. Comme nucleotide marque de ce type, on peut citer par exemple le 1,3- 16 N dATP, le 
1 1 3- 15 NdCTP, le 2,8-dichloro ou dibromo ou difluoro dATP, le 5,5-dibromo dCTP. Ceci permet d'accroTtre 
d'autant la sensibilite obtenue lors de la detection et de ('identification des chaTnes nucleotidiques. 

En second lieu, plusieurs marqueurs differents peuvent §tre incorpores au sein d'un meme nucleotide afin 40 
d'affiner sa signature. De plus, la detection simultanee de plusieurs marqueurs augmente considerablement 
les combinaisons de marquages possibles. 

L'exemple suivant montre que trols types de marqueurs isotopiques stables suffisent a Identification de 
quatre nucleotides differents : 



13c seul Nucleotide de type A 

13c + 17o Nucleotide de type G 

13c + 15n Nucleotide de type C 

15n + 17o Nucleotide de type T 



45 



50 



Ainsl, les marquages intrinseques et extrinseques des nucleotides a Paide d'isotopes stables peuvent dtre 
combines et offrent de reelies possibilttes multiples et varices. 

Cette methode de marquage s'avere plus souple et plus riche d'evolutlon que les marquages 
radio-isotopiques ou par fluorophores selon Part anterieur qui restent forcement plus llmites dans leurs ' 55 
possibiifles. De plus, la plupart des inconvenients rencontres avec ces demiers lors de leur manipulation et de 
leur utilisation sont 6vites voire complement elimin6s. 

Les chaTnes d'ADN marquees sont alors placees dans une source 8 appropriee pour leur separation par 
chromatographle, representee par le bloc 10. 

A cet effet, les chaTnes marquees sont introduites dans une colonne de chromatographle ou colonne 60 
d'eiectrophorese sur gel en vue de les separer suivant leur taille, leur charge ou meme d'autres proprietes 
physiques. Pour le sequencage d'ADN, les chaTnes marquees dont la longueur differe d'un simple nucleotide 
sont separees par electrophorese dans une matrice de gel polyacryi amide. 

II en resulte que dans le fond et pres du fond de la colonne de chromatographle, les chaTnes d'ADN sont 
resolues les unes des autres et peuvent fitre extraites et prises en compte par une source tfions en vue 65 
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d'ioniser les chalnes separees, comme indique par le bloc 12. 

Ensuite les Ions sont selectionnes et detectes par spectrometrle de masse comme Indique en 14 puis les 
signaux foumls par la spectrometrle de masse sont traites. comme indique en 16. en vue de reconstltuer I'ADN 
de depart. 

5 ^installation permettant le sequencage automatise de I'ADN, conformement a I'lnvention. est schematisee 
sur la figure 2. La fragmentation du genome, les reactions chimiques de sequencage et le marquage etant 
•tractate <to facon discrete ou de facon independante dans le temps, ne sont pas represents sur la figure 2. 

'nstallation representee comporte une source 18 de chaTnes marquees d'ADN a I'aide d'isotopes stables 
selon I mventon contenant une cuve 20 destinee a recevoir I'echantillon 21 des chaTnes marquees d'ADN 
10 mises en solution dans un tampon portee a la haute tension grace a une source d'alimentation electrique 22. 
Le fond de la cuve 20 est muni d'un orifice couple a un tube electrophoretique 24 de 1 mm de diametre 

mZT^^^J 3 ?^ C °T rir un 0el PohwyHml* : I'extremite de sortie 26 du tube constituant une 
anode debouche a I interleur d'une source d'ions 28 portee au potentiel de la masse. 

« a. TZ^ U jli? ff B ^ rare 1 ?" P articulier a""**!, 'ntroduft dans la source 28, via une condulte 30, au sein 

Z&^EFSESF"* les chaInes marqu6es ,ssues du tube *-^*» » «* 

Str^S^f au couplage de different* types de tube electrophoretique peuvent 

etre 'sees. Elles font appel ou peuvent combiner divers processus physiques courante d'atomisatton tola 
que I'electrospray, le thermospray, la nebulisation. aromisanon xeis 

20 Les aerosols obtenua sont alors introduits dans une source a plasma 32 equipee de bobines 
Slectromagnetiques 33 reliees a un generates radiofrequence 34. Dans la zone 32a la plus chaud > du p£n? 
ou la temperature atteint 7000 a 8000»K. les molecules d'ADN sont atomisees et ionisees 
««TJS2T P f^ m f BSt * SOUrce P r6f6r6e d'ionisatlon selon I'lnvention car elle permet I'atomlsatJon 

25 dSents ^is C ^ S ' mPllCit6 maXi,nale ^ 16 SpSCtre dB maSSe ° bte ™ -PrtS^SSS 

at^H, ^1°J^ S S ° nt ■"2? Pris e " charfle ^ ,,0 P«quB d'entree 36 d'un spectrometre de masse 38 qui peut 
etre du type secteur magnetique ou un vide differentiel s'lnstalle grace a des pompes primalres et secondares 
39 ; la pression au niveau de I'optique ionique 36 est de I'ordre de 10"* torr (io-5pi) ^EatSallS 
des p.eces potatres 40 du spectrometre est de I'ordre de 10"* torr (10-* Pa) P ressl <* au niveau 

36^ LS e „M SP T,' nil ? de maSSe 38 est de s6lecti «>nner et d'identffier grace a son optique Ionique 
f^S 5 P° ,airos f 0 ' la V*™* des spedfiques obtenues grace au traceur isoiopique uUM 

precedemment. Le spectrometre de masse 38 peut operer en mode selectif ce qui conslsteTbataver 

La detection par spectrometrle de masse permet a lafols de detecter les chalnes d'ADN marauees au furet 
ouTn^^^^ 

quel nucleotide elles correspondent. Cette Information donne la sequence d'ADN ^ 

detelte™ 42 U S,e°4 ta^Sp^ 0 "? 88 ^ d ° "lasse sont alors detectees a I'aide d'un 

rimto^ . ■ la , sort,e du spectrometre 38, du type multlplicateur d'electrons et qui est sensible a 

I obtention d une sensibibte maximale de Installation totals de sequencage " ravonse 

d'ions°l8 taEM EVT IT" 1 t de ChW " neS mart l u6es . d " t""e d'electrophoretique 24. de la source 
d 6 d« It Q ^ , t0rQh ! n 4 plaSma 321 et d ' un s P e ctrometre de masse 38 equlpe de son opUque d'entree 
™J£LT P f « S 'J?™ 8 40 et de son d6tecte «" « sont en particulier donnes dans ('article AnahrHc^ 
%Z?T f ; ^ 1 T. 8 d aVr " 198? ' P - 1230 1232 ' ,ntitul6 "On-line mass spectrometrle detection fo ^Stoy 
.nTtull -.ndSt S l S ° i h 8 " 8 rarti ?' e Analyt ' Cal ChemiSt, y' VoL 52 ' N ° ^ e Decembre M^.^S 
Memento- ^ P d ^ P,aSma 38 8,1 '° n SOUrC8 for ^ 8 P«trometric determination of trace 

Le signal 6lectrique issu du detecteur 42 est alors amplifie grace a 1'amplificateur 44 avant d'etre recu dans 

s kTltl^ t ^ P t C T 96re auto ™«quement 9 a "afois le pilotage de^ve^s^s^emblel 
(18. 28. 38) de I installation, le traitement et la representation des donnees 

exDncaHfteLn^A ^ ' 6 d °I! n , 6eS obtenues P ar "'installation representee sur la figure 2. A titre 

pa? .'adl neMes lion^A^fl C * M *" T''" 66 de " nucl6otides - d °nt ''""e des extremi?6s se termini 
nucleotides don^ ff; Z T ' L^l A ^ Correspondent - respectivement. a des chaTnes marquees de n^ et n-9 
par isotooe sLhiL ?„ de8 « xtr f mit6 f s ,f I'ad6nlne ; les trois adenines terminales etant marquees 

L -lv^ T^-.fSPf 16 iS0,0pe 11 " en est de mSme P° ur les autres bases. 
CB MM^Ti # J e "f emble du svst6me de d etection de I'lnvention (inferieure au ppb) Indique que 

A ^ mf,c^ t « t falt a f qua ^ P ° ur effectuer «ne analyse de sequence d'ADN. q q 

figure 3 UStraM ' on donne c'-aP^. exemple de sequencage d'un ADN hypothetlque. en se referent a la 

L'ADN a sequencer est le TGACTGCACGTA. Aussl. toutes les chalnes marquees dans la source de 
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chaTnes 8 ou 18 commencent par un T et se terminent par Tune des quatre bases X. Ces chain es resultent des 
reactions chimiques de sequencage de Sanger ou Maxam/Gilbert. Les chaTnes sont presentes p§!e-nnele 
dans rechantlllon 21. Elles component de 1 a 12 nucleotides tels que : TGACTGCACGTA, TGACTGCA. TGA, 
TGAC, TGACT, T, TGACTGCAC. 

Ces chaTnes sont separees selon teur tattle par electrophorese (etape 10) dans un tube 24 monopiste. On 
obtient les bandes d'electrophorese suivantes ordonnees de gauche a droite : 
TTT ... T ... TTT 
GGG ... G ... GG 
AAA ... A ... A 
CCC ... C 
TTT ... T ... 
GGG ... G 
CCC ... 
AAA 
CCC 
GGG 
TT 
A 

Chaque colonne represente une bande d'electrophorese qui contient en fait de I'ordre de plusfeurs dizaines 
de millions d'exemplaires de chacune des chaTnes. 

Ces chaTnes sont ensuite atomisees puis ionisees au fur et a mesure de leur sortie du gel electrophoretique, 
dans la source d'ions 28 (etape 12). 

Les chaTnes TG, TGACTG, etc, se terminant par de la guanine sont atomisees et ionisees et fournlssent un 
marqueur *G de type G. De mSme, les chaTnes se terminant par de I'adenine, teiies que TGA, TGACTGCA, etc, 
sont atomisees et ionisees et fournlssent des marqueurs *A, de type A. De meme, tes chaTnes se terminant 
respectlvement par C et T foumissent des marqueurs *C et *T. Ces marqueurs se trouvent meles a d'autres 
ions et, en particulier, a des ions de carbone, azote, oxygene ou hydrogene proven ant de I'ionisation des 
chaines, soft : 

0 N 

6* 
H C 



Aussi, le spectrometre de masse 38 (etape 14) pemnet la selection des marqueurs puts leur detection ion 
par ion. 

La detection, au cours du temps, d'ions caracteristiques des marqueurs utilises permet a la fois de deceler 
la presence des chaTnes d'ADN prises en compte par la source d'ions. et d'identifier leur familie suivant le type 
d'ions marquant leur extremlte. L'ordre de ces marqueurs pris en compte par I'ordinateur 46 (etape 16) donne 
I'ordre des bases ou sequences de I'ADN, soit ici GGAC. etc... 

L'invention ayant ete decrite en detail, II est evident que de I'ARN ou d'autres types de molecules 
biologiques complexes peuvent Stre analysees grace au procede et a rinstallation selon I'invention : 
i'electrophorese a en effet d'autres applications que le sequencage de I'ADN. 

Cette technique separative sert aussi a separer des fragments de molecules biologiques complexes (ADN, 
ARN, proteines) afin de determiner leur taille. Pour se faire, la vitesse de migration de ces fragments est 
comparee a celle de fragments de tallies connues, les echantillons etant deposes sur des pistes adjacentes. 
Gr^ce a I'invention, II est possible de marquer avec des isotopes ou petites molecules stables differentes, les 
differents echantillons ainsl que les marqueurs de taille. Ceux-cl sont ensuite dfeposes sur une meme piste 
d'electrophorese puis introdults en ligne dans la source du spectrometre de masse. L'atomlsatfon des 
fragments permet d'lsoler le marqueur et de le detector. Le type de marqueur detecte indique I'appartenance 
du fragment a tel ou tel echantiilon et son instant d'arrivee, par rapport aux instants d'arrivee des standards, 
Indique sa taille. 

De plus, ce type de marquage utilisfe pour marquer certains acides amines d'une proteine permet de 
detecter soit la proteine au sein d'un melange de proteine, soft la presence de ces acides amines au sein de 
cette proteine. 
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ANNEXE II 




R - HouOH 



a lf>h« - M,o (<L) tlWTP 
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ment : roC6d6 d ' ,denWiCatlon de te s6auB "<» <« bases dun ao.de nuclelque comportant essentie.le- 
M ™t£Sl Mi < lL P * dl f °" de . fra 9 merrts de nucleique a sequencer. 

n&SLtSL. f maK,Ua9e SP6Ci,iqUe d8SditeS ChaJneS avec des fe ° to P° s °" de petftes 
d) line etape (1 0) de separation des chalhes marquees 

3. Precede selon la revendication 1 ou 2, caracterlse en ce que le marquage est realis* de fecon 
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extrinseque avec au moins un isotope cholsi parml 19 F. 35 CI. 37 Ct, 78 Br. 81 Br et 127 l. 

4. Proced6 sel n Tune quelconque des revendications 1 a 3, caracterise en ce que Ton separe les 
chaTnes par chromatographic avec une seule piste chromatographique. 

5. Procede selon Tune quelconque des revendications 1 a4, caracterise en ce queJ'aclde nucleique est 
I'ADN. 

6. Procede selon la revindication 5, caracterise en ce que le marquage est effectue sur les bases, les 
sucres ou les triphosphates des formes desoxy-trlphosphatees (dXTP) ou dldesoxy-triphosphatees 
(ddXTP) ou de teurs analogues alpha-thiotriophosphatees. 

7. Installation pour ('identification de la sequence des bases d'un acide nucleique comprenant : 

- une source (18) de chaTnes de nucleotides de taiiles differentes, marquees par des isotopes ou de 
petites moI6cules stables, 

- des moyens de separation (20, 22, 24, 26) de ces chaTnes marquees, 

- des moyens (28, 30, 32) d'atomisation et d'ionisation des chaTnes sortant des moyens de separation, 

- un spectrometry de masse (38) pour selectionner et detecter les ions, et 

- des moyens de traltement (44, 46) des signaux fournfs par le spectrometre. 

8. Installation selon la revendication 7, caracteris6e en ce que les moyens d'ionisation comprennent 
une torche a plasma (32) . 

9. Installation selon la revendication 7 ou 8, caracterisee en ce que les moyens de separation 
component un tube electrophoretique (24) monopiste et des moyens (20, 22, 26) pour assurer le passage 
des chaTnes dans le tube. 

10. Proc6d6 d'identification d'une proteine dans un melange de proteines ou de certains de ses acldes 
amines, comportant essentiellement : 

- une etape de marquage specffique desdits acldes amines avec des isotopes ou de petites molecules 
stables, 

- une etape de separation des proteines marquees, 

- une etape d'atomisation et d'ionisation de chaque proteine marquee puis, 

- une 6tape de detection en temps reel des Ions formes par spectrometrie de masse. 

11. Proced6 d'identification de la taille des fragments de molecules biologiques complexes, comprenant 
essentiellement : 

- une etape de marquage des fragments, 

- une etape de separation selon leur taille, des fragments marques specrfiquement et meles a des 
standards de taille, 

- une etape d'atomisation et d'ionisation des fragments puis une detection en temps reel des ions par 
spectrometrie de masse. 
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1) DIAGRAMME IDEALISE DE BANDES D'ADN MARQUEES PAR 

OES ISOTOPES STABLES DANS LE GEL D'UN TUBE ELECTROPHORETIQUE 
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INDICATIONS DU MARQUAGE 



ISOTOPE 1 
ISOTOPE 2 
ISOTOPE 3 
ISOTOPE 4 
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2J RESULTAT IDEALISE DE LA DETECTION DES BANDES MARQUEES A PaRTIR DE LA 
REPRESENTATION DU TUBE CI-DESSUS 

INTENSITE DU SIGNAL SUR LES 
MASSES CARACTERISTIQUES A : 

L 1 ISOTOPE 1 A A \_ (A) 

L 1 ISOTOPE 2 A __A A (G) 

L' ISOTOPE 3 . A A A {c) 

L ' ISOTOPE 4 _A _J\ A (T) 
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FIG. 3 
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